DE eng

Search in the Catalogues and Directories

Hits 1 – 2 of 2

1
Thésaurus distributionnels pour la recherche d'information et vice-versa
In: Conférence en Recherche d’Information et Applications ; https://hal.archives-ouvertes.fr/hal-01226532 ; Conférence en Recherche d’Information et Applications, Mar 2015, Paris, France (2015)
BASE
Show details
2
Thésaurus distributionnels pour la recherche d'information et vice-versa
In: ISSN: 1279-5127 ; EISSN: 1963-1014 ; Document Numérique ; https://hal.archives-ouvertes.fr/hal-01226551 ; Document Numérique, Lavoisier, 2015, 18 (2-3), ⟨10.3166/DN.18.2-3.101-121⟩ (2015)
Abstract: National audience ; Distributional thesauri are useful in many tasks of Natural Language Processing. In this paper, we address the problem of building and evaluating such thesauri with the help of Information Retrieval concepts. Two main contributions are proposed. First, in the continuation of the work of Claveau et al., 2014, we show how IR tools and concepts can be used with success to build thesaurus. Through several experiments and by evaluating directly the results with reference lexicons, we show that some IR models outperform state-of-the-art systems. Secondly, we use IR as an application framework to indirectly evaluate the generated thesaurus. Here again, this task-based evaluation validate the IR approach used to build the thesaurus. Moreover, it allows us to compare these results with those from the direct evaluation framework used in the literature. The observed differences question these evaluation habits. ; Les thésaurus distributionnels sont utiles à de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problèmes de leur construction et de leur évaluation sous l'angle de la recherche d'information. Deux contributions sont proposées. D'une part, en poursuite des travaux initiés par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent être utilisées avec succès pour construire ces thésaurus. Au moyen d'une évaluation directe par comparaison avec des lexiques de référence et au travers de plusieurs expérimentations, nous montrons que les résultats obtenus par des modèles de RI dépassent les performances des systèmes état de l'art. D'autre part, nous utilisons la RI comme cadre applicatif pour proposer une évaluation indirecte des thésaurus produits. Là encore, cette évaluation valide l'approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des évaluations directes utilisées dans la littérature. Les différences constatées remettent en cause en partie ces pratiques d'évaluation. MOTS-CLÉS : thésaurus distributionnels, sémantique distributionnelle, construction de lexique, modèles de RI, évaluation directe, évaluation par tâche, extension de requêtes.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR]; direct evaluation; distributional semantics; distributional thesaurus; IR models; lexicon generation; query expansion; task-based evaluation
URL: https://doi.org/10.3166/DN.18.2-3.101-121
https://hal.archives-ouvertes.fr/hal-01226551/document
https://hal.archives-ouvertes.fr/hal-01226551
https://hal.archives-ouvertes.fr/hal-01226551/file/Claveau_Kijak_DN2015.pdf
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
2
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern